2.14 表格缺失值行、列的删除
删除DataFrame表格中有缺失的行列,应该是行列删除中的一种特殊情况, 它并不是使用df.drop()函数,而是
df.dropna()这个专用函数,该函数的写法是: df.dropna (axis=指定删除行列方向,how=指定删除方式,inplace=True)
由于axis默认为0,即行方向删除有缺失值的行。
import pandas as pd
path = r "D:\Pyobject2023\object\测试\测试素材.xlsx"
df = pd.read_excel(path)
print (df)
返回:
姓名 | 年龄 | 考试日期 | 分数 | 语文 | |
---|---|---|---|---|---|
0 | 小明 | 25.0 | 2021-04-14 | 85.5 | 67.0 |
1 | 小张 | 36.0 | 2021-03-15 | 89.0 | NaN |
2 | 小王 | 47.0 | 2020-09-19 | 95.0 | 55.0 |
3 | 小李 | 21.0 | 2019-10-25 | 88.5 | NaN |
4 | NaN | NaN | NaT | NaN | NaN |
5 | 小四 | 29.0 | 2019-08-18 | 99.0 | 43.0 |
6 | 小管 | 33.0 | 2021-02-14 | 100.0 | NaN |
删除行:
import pandas as pd
path = r "D:\Pyobject2023\object\测试\测试素材.xlsx"
df = pd.read_excel(path)
print (df)
t=df.dropna( axis =0, how = "all" )
print (t)
返回:
姓名 | 年龄 | 考试日期 | 分数 | 语文 | |
---|---|---|---|---|---|
0 | 小明 | 25.0 | 2021-04-14 | 85.5 | 67.0 |
1 | 小张 | 36.0 | 2021-03-15 | 89.0 | NaN |
2 | 小王 | 47.0 | 2020-09-19 | 95.0 | 55.0 |
3 | 小李 | 21.0 | 2019-10-25 | 88.5 | NaN |
5 | 小四 | 29.0 | 2019-08-18 | 99.0 | 43.0 |
6 | 小管 | 33.0 | 2021-02-14 | 100.0 | NaN |